導(dǎo)讀:即使2018年對(duì)數(shù)據(jù)中心正常運(yùn)行時(shí)間的新威脅繼續(xù)出現(xiàn),已知的原因?qū)е挛覀兘衲昕吹降拇蠖鄶?shù)數(shù)據(jù)中心停機(jī)。根據(jù)Uptime Institute今年夏天公布的調(diào)查結(jié)果顯示,近三分之一的數(shù)據(jù)中
發(fā)表日期:2020-02-08
文章編輯:興田科技
瀏覽次數(shù):8005
標(biāo)簽:
即使2018年對(duì)數(shù)據(jù)中心正常運(yùn)行時(shí)間的新威脅繼續(xù)出現(xiàn),已知的原因?qū)е挛覀兘衲昕吹降拇蠖鄶?shù)數(shù)據(jù)中心停機(jī)。
根據(jù)Uptime Institute今年夏天公布的調(diào)查結(jié)果顯示,近三分之一的數(shù)據(jù)中心在過(guò)去一年中發(fā)生了中斷事故,而前一年則為25%。但這一增長(zhǎng)并不是由于一些致命的新惡意軟件造成的。
相反,導(dǎo)致停機(jī)的三大原因是斷電(33%)、網(wǎng)絡(luò)故障(30%)以及IT或軟件錯(cuò)誤(28%)。
最重要的是,80%的數(shù)據(jù)中心經(jīng)理表示他們最近的停機(jī)事故是可以預(yù)防的。
您無(wú)法阻止雷擊(例如9月份在圣安東尼奧市拆除Microsoft Azure數(shù)據(jù)中心的雷擊)或零日惡意軟件攻擊。但是,通過(guò)適當(dāng)?shù)囊?guī)劃和數(shù)據(jù)中心設(shè)計(jì),由于意外的天氣事件、攻擊、常規(guī)人為錯(cuò)誤或未打補(bǔ)丁的系統(tǒng)導(dǎo)致的中斷,可以最大限度地減少影響。
在中斷發(fā)生后,使數(shù)據(jù)中心快速啟動(dòng)并運(yùn)行同樣重要。根據(jù)信息技術(shù)情報(bào)咨詢(xún)公司今年的報(bào)告,平均每小時(shí)的停機(jī)時(shí)間將花費(fèi)數(shù)據(jù)中心運(yùn)營(yíng)商26萬(wàn)美元,而5分鐘的停機(jī)時(shí)間僅花費(fèi)2600美元。
基礎(chǔ)設(shè)施冗余仍然有效
在最基本的層面上,數(shù)據(jù)中心系統(tǒng)需要備份。備份電源和冷卻系統(tǒng)、備份數(shù)據(jù),甚至備份整個(gè)數(shù)據(jù)中心。
備份工作。據(jù)Uptime稱(chēng),在擁有2N個(gè)用于冷卻和電源的架構(gòu)的數(shù)據(jù)中心(換句話說(shuō),一個(gè)完全冗余的、鏡像的系統(tǒng))中,22%的數(shù)據(jù)中心去年發(fā)生過(guò)故障。這比那些選擇低成本,非完全冗余的N + 1方法的人減少了三分之一的停機(jī),和33%的人報(bào)告了斷電。
完整的數(shù)據(jù)中心備份可提供更高的可靠性。根據(jù)Uptime的數(shù)據(jù),40%的數(shù)據(jù)中心經(jīng)理表示他們會(huì)在兩個(gè)或多個(gè)站點(diǎn)上復(fù)制工作負(fù)載和數(shù)據(jù)。
“如果你只有一個(gè)數(shù)據(jù)中心并且遇上雷擊,那么你就麻煩了。”SSH 通信安全公司首席技術(shù)官馬爾庫(kù)羅西表示?!澳銘?yīng)該有一個(gè)輔助數(shù)據(jù)中心,它們之間具有物理隔離,不依賴(lài)于相同的能源?!?/p>
他補(bǔ)充道,沒(méi)有任何數(shù)據(jù)中心能夠幸免于這個(gè)問(wèn)題的影響,他指的是9月份微軟位于美國(guó)中南部的數(shù)據(jù)中心。
“有第二個(gè)設(shè)置并立即進(jìn)行故障轉(zhuǎn)移?!彼f(shuō)
無(wú)論什么備份系統(tǒng)到位,規(guī)劃和測(cè)試都是關(guān)鍵,Rossi補(bǔ)充說(shuō),規(guī)劃需要考慮當(dāng)今數(shù)據(jù)中心的復(fù)雜性,其中問(wèn)題可能引發(fā)其他問(wèn)題。
他使用了最近在物理維護(hù)期間發(fā)生的GitHub中斷作為例子?!八麄?cè)趲追昼妰?nèi)修復(fù)了物理問(wèn)題,但需要24小時(shí)才能使數(shù)據(jù)正確同步?!彼f(shuō)。
數(shù)據(jù)中心經(jīng)理需要查明潛在的問(wèn)題區(qū)域,然后在發(fā)生事情時(shí)準(zhǔn)備好工具和流程。
羅西說(shuō):“專(zhuān)注于建立流程,建立你為失敗做準(zhǔn)備所需的心態(tài)?!?/p>
加強(qiáng)中心,不僅僅是周邊
數(shù)據(jù)中心管理人員應(yīng)該從最近發(fā)生的與惡意軟件相關(guān)的中斷中吸取的最大教訓(xùn)之一就是,僅僅有一個(gè)堅(jiān)固的外圍是不夠的。
今年醫(yī)療保健公司、政府機(jī)構(gòu)、教育機(jī)構(gòu)和主要制造商都受到了沖擊,盡管在去年創(chuàng)紀(jì)錄的違規(guī)行為之后,每個(gè)人都應(yīng)該已經(jīng)處于高度戒備狀態(tài)。
顯然,保持最新防御,防止惡意軟件首先進(jìn)入是至關(guān)重要的。但數(shù)據(jù)中心管理人員必須準(zhǔn)備好看到他們的外圍防御失敗并具備二級(jí)保護(hù)。
其中包括惡意流量檢測(cè)機(jī)制、網(wǎng)絡(luò)防御(如分段)、最低權(quán)限的訪問(wèn)和通信方法。
總部位于以色列的網(wǎng)絡(luò)安全公司GuardiCore的產(chǎn)品管理總監(jiān)伊格爾利夫茨茨表示,這些可能有助于防止惡意軟件進(jìn)入網(wǎng)絡(luò)后傳播,或至少減緩其速度,使安全團(tuán)隊(duì)有機(jī)會(huì)做出回應(yīng)。
WannaCry特別利用了服務(wù)器消息塊傳輸協(xié)議中的漏洞。他說(shuō),數(shù)據(jù)中心應(yīng)該采取更多措施來(lái)減少橫向通信。
“在過(guò)去一年中WannaCy勒索軟件的許多案例中,造成攻擊廣泛影響的主要原因是,一旦這些蠕蟲(chóng)在數(shù)據(jù)中心內(nèi)立足,就很容易擴(kuò)散。”利夫茨茨說(shuō)。“事實(shí)上,服務(wù)器之間的SMB流量根本不是必需的。如果它被阻止,攻擊的擴(kuò)散和對(duì)數(shù)據(jù)中心的破壞可能會(huì)大大減少,并且在之前的早期階段就會(huì)檢測(cè)到攻擊造成了這么大的傷害。”
今年違規(guī)的重要教訓(xùn)并不是數(shù)據(jù)中心經(jīng)理必須防范的新威脅。他們需要重新回歸基礎(chǔ)。
幾乎所有的數(shù)據(jù)中心停機(jī)都是由于糟糕的規(guī)劃和投資決策,加上流程不良或無(wú)法遵循流程,Uptime Institute研究執(zhí)行主任安迪勞倫斯在6月份的報(bào)告中寫(xiě)道。“幾乎所有由正常運(yùn)行時(shí)間研究所報(bào)告或研究的故障以前都發(fā)生過(guò),而且通常有詳細(xì)的文檔記錄?!?/p>
雷電襲擊和新型惡意軟件可能占據(jù)所有頭條新聞,但它在恢復(fù)能力方面仍然是最重要的基礎(chǔ)知識(shí)。
更多新聞
2020
華為Mate40Pro迎來(lái)第一次破發(fā),后蓋裂成蛛網(wǎng),讓人心疼得不行最近華為應(yīng)該是市場(chǎng)上最火的手機(jī)品牌,華為Mate40系列發(fā)布后成功吸引了眾多消費(fèi)者的目光。由于芯片數(shù)量有限,這臺(tái)機(jī)
View details
2020
跑分超90萬(wàn)!華為Mate40Pro+獲頂級(jí)認(rèn)證,2項(xiàng)技術(shù)世界第一 不負(fù)旗艦之名,華為新旗艦Mate40系列,在各方面的表現(xiàn)都令人驚訝。例如,華為Mate40 Pro不僅拿
View details
2020
任:中國(guó)的芯片設(shè)計(jì)已經(jīng)進(jìn)入世界領(lǐng)先地位,中國(guó)的芯片制造也是世界第一,但是存在問(wèn)題11月10日,華為衷心社區(qū)發(fā)布《任總在C9高校校長(zhǎng)一行來(lái)訪座談會(huì)上的講話》。在郵件中,任表示,我
View details
2020
國(guó)產(chǎn)5G良心手機(jī),價(jià)格跌到1699元,128GB 44W閃充53萬(wàn)跑點(diǎn)在2020紫光展銳市場(chǎng)峰會(huì)上,中國(guó)聯(lián)通終端與渠道支持中心副總經(jīng)理陳風(fēng)衛(wèi)表示,5G手機(jī)普及率已經(jīng)超過(guò)62%??梢?jiàn)5G手機(jī)已經(jīng)
View details